# -*- coding: utf-8 -*-
"""
@Time    : 2024/7/24 10:02 
@Author  : ZhangShenao 
@File    : 7.使用自定义的Blob解析器.py 
@Desc    : 使用自定义的Blob解析器LineDelimiterBlobParser
"""
from langchain_core.documents.base import Blob

from line_delimiter_blob_parser import LineDelimiterBlobParser

# 使用Blob加载二进制文件
blob = Blob.from_path(path='./docs/静夜思.txt')

# 创建Blob解析器
parser = LineDelimiterBlobParser()

# 解析Blob二进制文件
docs = list(parser.lazy_parse(blob))

for doc in docs:
    print(f'page content: {doc.page_content}, metadata: {doc.metadata}')
